Cách trích ra dữ liệu Wikipedia:Dữ_liệu_nhân_vật

Trích ra dùng Python

Có thể dùng khuôn khổ pywikipediabot (bằng Python) để tìm kiếm các bài dùng tiêu bản Dữ liệu nhân vật, lấy nội dung,, và lọc thông tin giữa {{Dữ liệu nhân vật |}}.

Trích ra từ cơ sở dữ liệu SQL

Dùng truy vấn SQL, có thể lọc ra dữ liệu nhân vật khỏi những bài Wikipedia được lưu giữ trong cơ sở dữ liệu. Cho thí dụ, đây là truy vấn SQL có thể dùng để trích dữ liệu nhân vật từ wikisign.org:

SELECT   pages.cur_namespace,   pages.cur_title,   SUBSTRING(SUBSTRING(pages.cur_text FROM INSTR(pages.cur_text,'{{Dữ liệu nhân vật')), 1,      INSTR(SUBSTRING(pages.cur_text FROM INSTR(pages.cur_text,'{{Dữ liệu nhân vật')),'}}')+1)      AS 'Dữ liệu nhân vật'FROM cur AS pdJOIN templatelinks AS tl   ON pd.cur_namespace = tl.tl_namespace   AND pd.cur_title = tl.tl_titleJOIN cur AS pages   ON tl.tl_from = pages.cur_id   AND pages.cur_namespace = 0WHERE pd.cur_namespace = 10AND pd.cur_title = 'Dữ liệu nhân vật'

Để trích các bài gọi tiêu bản {{Persondata}} hay {{Personendaten}} (cả hai đổi hướng đến {{Dữ liệu nhân vật}}), đổi hai cái "Dữ liệu nhân vật" đầu tiên thành "Persondata" hay "Personendaten". Trước khi có thể sử dụng dữ liệu trong bảng này, mã nguồn phải được phân tách tiếp.

Liên quan